#Sakana AI23.06.2025
Reinforcement-Learned Teachers от Sakana AI: Революция в эффективном обучении рассуждению LLM
Sakana AI представляет Reinforcement-Learned Teachers (RLTs) — новый подход, который обучает небольшие модели эффективно преподавать рассуждение большим языковым моделям через RL, ориентированное на создание пошаговых объяснений.